在一間連鎖企業當 IT 人員, 分公司遍佈全台灣, 而各分公司業務狀況都是透過 MPLS VPN 回傳, 加上 VoIP 網路電話, 監控系統等資訊設備, 還有 ISP 的 VPN 設備, 就算可以自己寫 shell script 或批次檔來檢查, 也需要不少時間.
之前試用過 Cacti , 可以透過 SNMP 協定詳細列出各主機狀況, 不過以前安裝的設備很少啟用這個功能, 加上要發通報需要額外安裝插件(plug-in), 所以覺得不適合現在的公司環境使用.
後來發現有 Nagios 這套軟體, 看起來功能很多, 不過發現設定檔需要以文字檔儲存, 考慮到一個系統不應該只由一個人會用與維護(至少如果我離職, 不想接電話回答或解釋 :p ), 所以還是放棄.
再來又看到 OpenNMS , 雖然是自由軟體(開放軟體, 名稱或相關授權可能要再確認), 以 Java 開發, Windows / Linux 都可以安裝, 所以初期以 Linux 環境測試, 將來要正式上線的話, 還可以裝在 Windows 上.
既然有工具, 就要先想想工具的用途, 目前公司內已經有:
所以整理一下:
安裝方式就省略, 用 Debian + Oracle Java + PostgreSQL + OpenNMS , 可以找到不少文章.
安裝之前其實就有先想, 資訊系統在公司內的結構與特性, 可以有三種屬性:
所以裝好 OpenNMS 之後, 先確認幾個功能目標:
第1項比較簡單, OpenNMS 把設備稱為 node , 列出設備稱為 discovery , 所以把要列出的 IP , 列在 discovery include range 內即可. OpenNMS 會以常用的服務去查, 例如: ICMP(ping), http, ftp, snmp, smtp 等.
第2項則是有一個 manage 清單, 如果是業務人員帶筆電到分公司, 連線狀況本來就不穩定, 可以在第一項就不列在 include range , 或在 manage 清單中取消勾選.
而通報系統是採用 e-mail 方式, 利用公司現有的 mail server 發信給 IT 人員.
第3到第4項就還在測試, 雖然看到一些網站說可以設定哪些設備有離線時間, 不過還沒成功.
第5項則是希望有階段性的判斷, 例如 ISP 網路設備不通, 後台也不通, 就不用重複發通知, 這個就不強求了.
而下班前, 就發生某分公司斷電, 收到了幾封 mail , 雖然不希望常收到這種信, 不過也表示環境大致上結構是對的, 剩下通報頻率(例如 ISP 瞬斷, 雖然也該修理不過業務可以勉強運作)等.
也許下回上山工作閒來沒事,可以試著把這套"使用"中譯...呵。
slime提到:
Nagios
記得這個在SA曾有專人介紹過。
jacky1122提到:
中譯
專有名詞有時後真的很難翻譯 ^^
這套對中文相容性不太好....如果電腦名稱是中文會變亂碼.... @_@
(雖然電腦名稱本來就常跟中文不相容)
5年前有玩過這套~
還有網頁可以查看SNMP的回報
最近要作主機效能監控,所以研究了一下 zabbix,還蠻好用的
http://www.netadmin.com.tw/article_content.aspx?sn=1404100003&jump=1
請問hon2006,有監控設定教學說明可以分享嗎,謝謝,主要是透過snmp監控網路設備,目前現有環境已有廠商提供的網路監控系統,但授權年底到期就無法使用,所以想以zabbix server來取代